一些基于变压器的模型可以执行跨语言转移学习:这些模型可以通过一种语言对特定任务进行培训,并以另一种语言的同一任务给予相对良好的结果,尽管仅在单语任务中进行了预先培训。但是,关于这些基于变压器的模型是否学习跨语言的通用模式,目前尚无共识。我们提出了一种单词级的任务不可能的方法,以评估此类模型构建的上下文化表示的对齐方式。我们表明,与以前的方法相比,我们的方法提供了更准确的翻译成对,以评估单词级别对齐。我们的结果表明,基于多语言变压器模型的某些内部层优于其他明确对齐的表示,甚至根据多语言对齐的更严格的定义,更是如此。
translated by 谷歌翻译
White matter bundle segmentation is a cornerstone of modern tractography to study the brain's structural connectivity in domains such as neurological disorders, neurosurgery, and aging. In this study, we present FIESTA (FIber gEneration and bundle Segmentation in Tractography using Autoencoders), a reliable and robust, fully automated, and easily semi-automatically calibrated pipeline based on deep autoencoders that can dissect and fully populate WM bundles. Our framework allows the transition from one anatomical bundle definition to another with marginal calibrating time. This pipeline is built upon FINTA, CINTA, and GESTA methods that demonstrated how autoencoders can be used successfully for streamline filtering, bundling, and streamline generation in tractography. Our proposed method improves bundling coverage by recovering hard-to-track bundles with generative sampling through the latent space seeding of the subject bundle and the atlas bundle. A latent space of streamlines is learned using autoencoder-based modeling combined with contrastive learning. Using an atlas of bundles in standard space (MNI), our proposed method segments new tractograms using the autoencoder latent distance between each tractogram streamline and its closest neighbor bundle in the atlas of bundles. Intra-subject bundle reliability is improved by recovering hard-to-track streamlines, using the autoencoder to generate new streamlines that increase each bundle's spatial coverage while remaining anatomically meaningful. Results show that our method is more reliable than state-of-the-art automated virtual dissection methods such as RecoBundles, RecoBundlesX, TractSeg, White Matter Analysis and XTRACT. Overall, these results show that our framework improves the practicality and usability of current state-of-the-art bundling framework
translated by 谷歌翻译
逆运动学(IK)系统通常相对于其输入特征很僵硬,因此需要将用户干预适应新骨架。在本文中,我们旨在创建一个适用于各种人类形态的灵活的,学到的IK求解器。我们扩展了最先进的机器学习IK求解器,以在众所周知的皮肤多人线性模型(SMPL)上运行。我们称我们的模型SMPL-IK,并表明当集成到实时3D软件中时,该扩展系统为定义新型AI-Asissist Animation Workfrows提供了机会。例如,通过允许用户在摆姿势的同时修改性别和身体形状,可以使姿势创作更加灵活。此外,当使用现有姿势估计算法链接时,SMPL-IK通过允许用户从2D图像引导3D场景来加速摆姿势,同时允许进一步编辑。最后,我们提出了一种新颖的SMPL形状反转机制(SMPL-SI),将任意类人形特征映射到SMPL空间,使艺术家能够在自定义字符上利用SMPL-IK。除了显示拟议工具的定性演示外,我们还介绍了H36M和Amass数据集上的定量SMPL-IK基准。
translated by 谷歌翻译
使用机器学习算法从未标记的文本中提取知识可能很复杂。文档分类和信息检索是两个应用程序,可以从无监督的学习(例如文本聚类和主题建模)中受益,包括探索性数据分析。但是,无监督的学习范式提出了可重复性问题。初始化可能会导致可变性,具体取决于机器学习算法。此外,关于群集几何形状,扭曲可能会产生误导。在原因中,异常值和异常的存在可能是决定因素。尽管初始化和异常问题与文本群集和主题建模相关,但作者并未找到对它们的深入分析。这项调查提供了这些亚地区的系统文献综述(2011-2022),并提出了共同的术语,因为类似的程序具有不同的术语。作者描述了研究机会,趋势和开放问题。附录总结了与审查的作品直接或间接相关的文本矢量化,分解和聚类算法的理论背景。
translated by 谷歌翻译
尽管深度学习架构最近取得了成功,但在现实词应用程序中,人重新识别(REID)仍然是一个具有挑战性的问题。最近,已经提出了几种无监督的单目标域适应性(STDA)方法,以限制源和目标视频数据之间通常发生的域移位引起的REID准确性下降。鉴于人REID数据的多模式性质(由于跨摄像头观点和捕获条件的变化),训练常见的CNN主链来解决跨多个目标域的域移动,可以为实时REID应用程序提供有效的解决方案。尽管在REID文献中尚未广泛解决多目标域的适应性(MTDA),但一种直接的方法包括混合不同的目标数据集,并在混合物上执行STDA以训练公共CNN。但是,这种方法可能导致概括不佳,尤其是在融合越来越多的不同目标域来训练较小的CNN时。为了减轻此问题,我们基于知识蒸馏(KD-REID)引入了一种新的MTDA方法,该方法适用于实时人员REID应用。我们的方法通过从多个专业的教师CNN中蒸馏出来,适应了目标域上常见的轻型学生骨干CNN,每个CNN都适用于特定目标域的数据。对几个具有挑战性的人REID数据集进行的广泛实验表明,我们的方法优于MTDA的最先进方法,包括混合方法,尤其是在训练像OSNET这样的紧凑型CNN骨架时。结果表明,我们的灵活MTDA方法可用于设计成本效益的REID系统,以实时视频监视应用程序。
translated by 谷歌翻译
我们表明,如果基于深度学习的插值器使用球形线性插值器作为基线,可以更准确,有效地求解在一组关键帧上进行人类运动的任务。我们从经验上证明了我们在实现最新性能的公开数据集上的方法的实力。我们通过证明$ \ delta $ - 优势相对于最后已知帧(也称为零速度模型)的参考,进一步概括了这些结果。这支持了一个更一般的结论,即在参考框架本地对输入帧的工作比以前的工作中主张的全球(世界)参考框架更准确,更强大。我们的代码可在https://github.com/boreshkinai/delta-interpolator上公开获取。
translated by 谷歌翻译
虽然年度作物旋转在农业优化起到至关重要的作用,但它们主要忽略了自动作物类型的映射。在本文中,我们利用了增加的注释卫星数据的数量,提出了一个同时的第一个深度学习方法建模包裹分类的年间和中内农业动态。除了简单的培训调整之外,我们的模型提供了超过6.3 miou指针的改善,这些作物分类最先进。此外,我们释放了具有超过300,000个注释的包裹的第一个大型多年农业数据集。
translated by 谷歌翻译
我们的工作重点是开发人类姿势的可学习神经代表,用于先进的AI辅助动画工具。具体而言,我们解决了基于稀疏和可变的用户输入(例如,身体关节子集的位置和/或方向)构建完整静态人姿势的问题。为了解决这个问题,我们提出了一种新型的神经结构,将残留连接与部分指定姿势编码的原型结合在一起,以从学习的潜在空间中创建一个新的完整姿势。我们表明,在准确性和计算效率方面,我们的体系结构的表现优于基准基线。此外,我们开发了一个用户界面,以将我们的神经模型集成到Unity,这是一个实时3D开发平台。此外,我们基于高质量的人类运动捕获数据,介绍了代表静态人类姿势建模问题的两个新数据集,该数据将与模型代码一起公开发布。
translated by 谷歌翻译
几乎每个机器学习算法的输入瞄准原子秤上的物质属性涉及笛卡尔原子坐标列表的转换为更称对称表示。许多最流行的表示可以被视为原子密度的对称相关性的扩展,并且主要在于基础的选择。相当大的努力一直致力于优化基础集,通常由关于回归目标行为的启发式考虑因素驱动。在这里,我们采取了不同的无监督的观点,旨在确定以最紧凑的方式进行编码的基础,可能是与手头数据集相关的结构信息。对于每个训练数据集和基础函数数,可以确定在这种意义上最佳的独特基础,并且可以通过用样条近似于近似地基于原始基础来计算。我们证明,这种结构产生了准确和计算效率的表示,特别是在构建对应于高于高机标相关性的表示时。我们提出了涉及分子和凝聚相机器学习模型的示例。
translated by 谷歌翻译